A4-5 検索結果整理のためのラベルセット選出計算高速化とWikipedia カテゴリからのラベルセット選出
細野湧城, 高本綺架, 廣中詩織, 梅村恭司 (豊橋技科大)
概要
我々は情報収集のために検索することが多いが,
適切なキーワードを使わないと,膨大な数の検索結
果が表示されてしまう.そこで,適切なキーワード
を思いつけないときでも検索結果を絞り込めるよ
うに,検索結果をうまく分類できるラベルセットを
提示することを考える.本研究では,ラベルの含ま
れる文書数(文書頻度)をもとに算出した適性度を
用いて,Wikipedia カテゴリをもとに生成した複数
のラベルセットを順位付ける.ラベルセットの数が
多いため適性度の計算に時間がかかるという問題
があったが,前処理を工夫し,文書頻度の計算に
Suffix Array を用いたアルゴリズムを利用すること
で,短時間で順位付けできた.